Điều khiển tối ưu bình phương tuyến tính Điều khiển tối ưu

Một trường hợp đặc biệt của bài toán điều khiển tối ưu phi tuyến chung được đưa ra trong phần trước là bài toán điều khiển tối ưu tuyến tính bậc hai (LQ). Bài toán LQ được phát biểu như sau. Cực tiểu hóa hàm chi phí thời gian liên tục thời gian bậc hai

J = 1 2 x ⊤ ( t f ) S f x ( t f ) + 1 2 ∫ t 0 t f [ x ⊤ ( t ) Q ( t ) x ( t ) + u ⊤ ( t ) R ( t ) u ( t ) ] d ⁡ t {\displaystyle J={\tfrac {1}{2}}\mathbf {x} ^{\top }(t_{f})\mathbf {S} _{f}\mathbf {x} (t_{f})+{\tfrac {1}{2}}\int _{t_{0}}^{t_{f}}[\,\mathbf {x} ^{\top }(t)\mathbf {Q} (t)\mathbf {x} (t)+\mathbf {u} ^{\top }(t)\mathbf {R} (t)\mathbf {u} (t)\,]\,\operatorname {d} t}

Chịu sự ràng buộc động tuyến tính bậc nhất

x ˙ ( t ) = A ( t ) x ( t ) + B ( t ) u ( t ) , {\displaystyle {\dot {\mathbf {x} }}(t)=\mathbf {A} (t)\mathbf {x} (t)+\mathbf {B} (t)\mathbf {u} (t),}

và điều kiện ban đầu

x ( t 0 ) = x 0 {\displaystyle \mathbf {x} (t_{0})=\mathbf {x} _{0}}

Một hình thức đặc biệt của bài toán LQ mà phát sinh trong nhiều bài toán thống điều khiển là bộ điiều chỉnh toàn phương tuyến tính (LQR), nơi tất cả các ma trận (tức là  A {\displaystyle \mathbf {A} } , B {\displaystyle \mathbf {B} } , , Q {\displaystyle ,\mathbf {Q} } , và  R {\displaystyle \mathbf {R} } ) là không đổi, thời gian ban đầu được đặt tùy ý tới zero, và thời gian cuối được lấy từ giới hạn  t f → ∞ {\displaystyle t_{f}\rightarrow \infty } (giả thiét cuối cùng này được gọi là đường chân trời vô tận). Bài toán LQR được phát biểu như sau. Tối thiểu hóa hàm chi phí thời gian liên tục bậc hai đường chân trời vô hạn

J = 1 2 ∫ 0 ∞ [ x ⊤ ( t ) Q x ( t ) + u ⊤ ( t ) R u ( t ) ] d ⁡ t {\displaystyle J={\tfrac {1}{2}}\int _{0}^{\infty }[\,\mathbf {x} ^{\top }(t)\mathbf {Q} \mathbf {x} (t)+\mathbf {u} ^{\top }(t)\mathbf {R} \mathbf {u} (t)\,]\,\operatorname {d} t}

Chịu sự ràng buộc động học bậc nhất tuyến tính bất biến theo thời gian 

x ˙ ( t ) = A x ( t ) + B u ( t ) , {\displaystyle {\dot {\mathbf {x} }}(t)=\mathbf {A} \mathbf {x} (t)+\mathbf {B} \mathbf {u} (t),}

Và điều kiện ban đầu

x ( t 0 ) = x 0 {\displaystyle \mathbf {x} (t_{0})=\mathbf {x} _{0}}

Trong trường hợp đường chân trời giới hạn, các ma trận bị giới hạn trong Q {\displaystyle \mathbf {Q} }  và  R {\displaystyle \mathbf {R} }  tương ứng là nửa xác định dương và xác định dương. Trong trường hợp đường chân trời vô hạn, tuy nhiên ma trận  Q {\displaystyle \mathbf {Q} }  và  R {\displaystyle \mathbf {R} }  không chỉ là tương ứng với nửa xác định dương và xác định dương, mà còn là hằng số. Những giới hạn thêm vào trên  Q {\displaystyle \mathbf {Q} }  và  R {\displaystyle \mathbf {R} }  trong trường hợp đường chân trời vô hạn được thực thi để đảm bảo rằng hàm chi phí vẫn dương.Hơn nữa, để đảm bảo hàm chi phí là được bao, hạn chế bổ sung được áp đặt mà cặp  ( A , B ) {\displaystyle (\mathbf {A} ,\mathbf {B} )}  là có thể điều khiển được. Lưu ý rằng hàm chi phí LQ hoặc LQR có thể được nghĩ một cách vật lý như là cố gắng để giảm thiểu năng lượng điều khiển (đo như một dạng bậc hai).

Bài toán đường chân trời vô hạn (tức là, LQR) có vẻ quá hạn chế và cơ bản vô dụng vì nó cho rằng người vận hành đang điều khiển hệ tới trạng thái zero và do đó đang lái đầu ra của hệ thống về không. Đây thực sự là chính xác. Tuy nhiên bài toán lái đầu ra đến một mức độ khác không mong muốn có thể được giải quyết sau khi một đầu ra zero được giải. Trong thực tế, nó có thể được chứng minh rằng bài toán LQR thứ cấp này có thể được giải quyết một cách rất đơn giản. Nó đã được chỉ ra trong lý thuyết điều khiển tối ưu cổ điển rằng điều khiển tối ưu LQ (hoặc LQR) có dạng phản hồi

u ( t ) = − K ( t ) x ( t ) {\displaystyle \mathbf {u} (t)=-\mathbf {K} (t)\mathbf {x} (t)}

trong đó  K ( t ) {\displaystyle \mathbf {K} (t)}  là ma trận có chiều hợp lý, cho bởi

K ( t ) = R − 1 B ⊤ S ( t ) , {\displaystyle \mathbf {K} (t)=\mathbf {R} ^{-1}\mathbf {B} ^{\top }\mathbf {S} (t),}

và  S ( t ) {\displaystyle \mathbf {S} (t)}  là là lời giải của phương trình vi phân Riccati. Phương trình vi phân Riccati có dạng

S ˙ ( t ) = − S ( t ) A − A ⊤ S ( t ) + S ( t ) B R − 1 B ⊤ S ( t ) − Q {\displaystyle {\dot {\mathbf {S} }}(t)=-\mathbf {S} (t)\mathbf {A} -\mathbf {A} ^{\top }\mathbf {S} (t)+\mathbf {S} (t)\mathbf {B} \mathbf {R} ^{-1}\mathbf {B} ^{\top }\mathbf {S} (t)-\mathbf {Q} }

Đối với bài toán LQ đường chân trời hữu hạn, phương trình Riccati được tích hợp ngược lại trong thời gian sử dụng điều kiện biên cuối

S ( t f ) = S f {\displaystyle \mathbf {S} (t_{f})=\mathbf {S} _{f}}

Đối với bài toán LQR đường chân trời vô hạn, phương trình vi phân Riccati được thay thế bằng phương trình Riccati đại số (ARE) như sau

0 = − S A − A ⊤ S + S B R − 1 B ⊤ S − Q {\displaystyle \mathbf {0} =-\mathbf {S} \mathbf {A} -\mathbf {A} ^{\top }\mathbf {S} +\mathbf {S} \mathbf {B} \mathbf {R} ^{-1}\mathbf {B} ^{\top }\mathbf {S} -\mathbf {Q} }

Hiểu rằng ARE phát sinh từ bài toán đường chân trời vô hạn, các ma trận  A {\displaystyle \mathbf {A} } , B {\displaystyle \mathbf {B} } , Q {\displaystyle \mathbf {Q} } , và  R {\displaystyle \mathbf {R} }  tất cả đều là hằng số. Nói chung có nhiều cách giải cho phương trình đại số Riccati và lời giải xác định dương (hoặc nửa xác định dương) là một lời giải trong đó được sử dụng để tính toán độ lợi phản hồi. Bài toán LQ (LQR) đã được giải quyết một cách tao nhã bởi Rudolf Kalman.[3]